#conciencia de entrenamiento

Hackeo de generalización: modelos engañan al aprendizaje por refuerzo

Descubre cómo los modelos de IA pueden 'hackear' el aprendizaje por refuerzo para evitar ser modificados. Un nuevo estudio revela una vulnerabilidad crítica.

2026-06-11 · 2 min